期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于图卷积神经网络的串联质谱从头测序
牟长宁, 王海鹏, 周丕宇, 侯鑫行
计算机应用    2021, 41 (9): 2773-2779.   DOI: 10.11772/j.issn.1001-9081.2020111875
摘要399)      PDF (11373KB)(335)    收藏
在蛋白质组学中从头测序是串联质谱肽段测序的重要方法之一,其具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序的复杂性,导致其测序的准确率远低于数据库搜索方法,制约了从头测序的广泛应用。针对从头测序准确率低的问题,提出一种基于图卷积神经网络(GCN)的从头测序方法denovo-GCN。该方法将质谱中谱峰之间的关系用图结构表示,并从每个相应的肽碎裂位点提取谱峰特征,然后通过GCN预测当前碎裂位点处的氨基酸类型,最后逐步组成完整的肽序列。通过实验确定了GCN模型的层数、离子类型组合和测序使用的谱峰数量这3个影响模型的重要参数,并将多个物种数据集用于实验对比。实验结果表明,该方法在肽水平上的召回率比基于图论的从头测序方法Novor、pNovo提高了4.0~21.1个百分点,比基于卷积神经网络(CNN)和长短期记忆(LSTM)网络的DeepNovo提高了2.1~10.7个百分点。
参考文献 | 相关文章 | 多维度评价
2. 基于多头注意力机制和残差神经网络的肽谱匹配打分算法
闵鑫, 王海鹏, 牟长宁
计算机应用    2020, 40 (6): 1830-1836.   DOI: 10.11772/j.issn.1001-9081.2019101880
摘要394)      PDF (1141KB)(401)    收藏
肽谱匹配打分算法在肽序列鉴定的过程中起着关键性作用,而传统的打分算法无法充分有效地利用肽碎裂规律进行打分。针对这一问题提出了一种结合肽序列信息表征的多分类概率和式打分算法deepScore-α,该算法不需要考虑全局信息进行二次打分,不存在理论质谱与实验质谱相似度计算方法的限制。deepScore-α使用一维残差网络对序列底层信息进行抽取,再通过多头注意力机制融合序列不同肽键位点对当前肽键位点断裂产生的影响从而生成最终的碎片离子相对强度分布概率矩阵,结合肽序列碎片离子的实际相对强度计算出最终的肽谱匹配得分。该算法与常用开源鉴定工具Comet以及MSGF+进行了比较:在人类蛋白组数据集上错误发现率(FDR)为0.01时,deepScore-α保留的肽序列数量提升了约14%,Top1命中率(正确肽序列在得分最高的谱图所占比例)最大提升约5个百分点。使用人类蛋白组数据集训练的模型在ProteomeTools2数据集上进行泛化性能测试,结果表明,在FDR为0.01的条件下deepScore-α保留的肽序列数量提升了约7%,Top1命中率提升了约5个百分点,Top1中来自Decoy库的鉴定结果减少约60%。实验结果证明,deepScore-α在较低FDR值情况下保留更多的肽序列并提升Top1的命中率,且具有较好的泛化性能。
参考文献 | 相关文章 | 多维度评价